基因分析業(yè)務(wù)挑戰
-
生信分析周期長(zhǎng)
傳統(tǒng)的線(xiàn)下基因測(cè)序非常耗時(shí),基因測(cè)序行業(yè)的快速發(fā)展和數(shù)據(jù)的爆炸式增長(zhǎng),使得生信分析面臨周期更大的挑戰,制約了行業(yè)的發(fā)展。
-
業(yè)務(wù)有淡旺季
測(cè)序業(yè)務(wù)一般為項(xiàng)目型,有明顯淡季和旺季之分,旺季業(yè)務(wù)量可能是淡季的10倍以上,企業(yè)按均值配置的IT設(shè)施難以滿(mǎn)足客戶(hù)訴求。
-
固定資產(chǎn)成本高
基因測(cè)序對(duì)伺服器的計(jì)算性能要求非常高,導(dǎo)致IT基礎(chǔ)設(shè)施成本居高不下,同時(shí) 整體IT集群的建設(shè)、部署、 擴容複雜。
-
數(shù)據(jù)量大
基因測(cè)序的原始數(shù)據(jù)、中間數(shù)據(jù)和結(jié)果數(shù)據(jù)的傳輸(shū)、共享, 可靠存儲(chǔ),I/O讀取性能, 都成為業(yè)務(wù)發(fā)展瓶頸, 急需解決。
產(chǎn)品優(yōu)勢(shì)
-
FPGA異構(gòu)加速
業(yè)界領(lǐng)先的FPGA加速雲服務(wù)平臺(tái),並針對(duì)基因場(chǎng)景推出基因高性能實(shí)例,定製硬體電路加速的基因算法,降低處理實(shí)驗(yàn),基因測(cè)序效率提升3~5倍。
-
高精度
FPGA異構(gòu)加速不改變生信分析軟體算法,只是從硬體層面進(jìn)行任務(wù)並行化異構(gòu)調(diào)度優(yōu)化,結(jié)果精確度和常規(guī)HPC保持一致,實(shí)現(xiàn)結(jié)果的高準(zhǔn)確度。
-
GATK標(biāo)準(zhǔn)流程
支持從原始數(shù)據(jù)fastq到生成vcf/gvcf結(jié)果的BWA+GATK標(biāo)準(zhǔn)生信分析流程的FPGA加速,解決全過(guò)程的所有高密度計(jì)算的同時(shí),提供標(biāo)準(zhǔn)的解決方案,方便客戶(hù)的使用。
-
豐富可靠的雲存儲(chǔ)
提供豐富的大數(shù)據(jù)存儲(chǔ),EVS/SFS滿(mǎn)足不同計(jì)算訴求的讀寫(xiě)存儲(chǔ)服務(wù),OBS提供超高網(wǎng)絡(luò)帶寬的數(shù)據(jù)傳輸(shū)、交付服務(wù),以及冷數(shù)據(jù)的下沉存儲(chǔ),降低冷數(shù)據(jù)的存儲(chǔ)成本。
功能描述
-
測(cè)序數(shù)據(jù)與參考基因組比對(duì)
支持BWA比對(duì)軟體的FPGA異構(gòu)加速,顯著提升BWA計(jì)算效率,大大縮短數(shù)據(jù)比對(duì)時(shí)間。經(jīng)測(cè)試30x人重測(cè)序數(shù)據(jù)(90GB)比對(duì)耗時(shí)從常規(guī)的20小時(shí)下降到2.5小時(shí)以內(nèi),且比對(duì)準(zhǔn)確度完全一致。
支持BWA比對(duì)軟體的FPGA異構(gòu)加速,顯著提升BWA計(jì)算效率,大大縮短數(shù)據(jù)比對(duì)時(shí)間。經(jīng)測(cè)試30x人重測(cè)序數(shù)據(jù)(90GB)比對(duì)耗時(shí)從常規(guī)的20小時(shí)下降到2.5小時(shí)以內(nèi),且比對(duì)準(zhǔn)確度完全一致。
-
單個(gè)樣本Germline遺傳變異檢測(cè)
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller 模式FPGA異構(gòu)加速,提高germline突變檢測(cè)運(yùn)行效率,一致率高達(dá)99.5%;經(jīng)測(cè)試30x人重測(cè)序數(shù)據(jù)(90GB)採用BWA+GATK(HaplotypeCaller)的FPGA加速計(jì)算germline突變檢測(cè),耗時(shí)可達(dá)6小時(shí)以內(nèi)。
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller 模式FPGA異構(gòu)加速,提高germline突變檢測(cè)運(yùn)行效率,一致率高達(dá)99.5%;經(jīng)測(cè)試30x人重測(cè)序數(shù)據(jù)(90GB)採用BWA+GATK(HaplotypeCaller)的FPGA加速計(jì)算germline突變檢測(cè),耗時(shí)可達(dá)6小時(shí)以內(nèi)。
-
腫瘤樣本Case-control樣本變異檢測(cè)
支持GATK v3.8和GATK v4.0.6版本的 Mutect2 模式FPGA異構(gòu)加速,提高Somatic突變檢測(cè)運(yùn)行效率,一致率高達(dá)99.5%。
支持GATK v3.8和GATK v4.0.6版本的 Mutect2 模式FPGA異構(gòu)加速,提高Somatic突變檢測(cè)運(yùn)行效率,一致率高達(dá)99.5%。
-
群體基因型GVCF檢測(cè)
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller --emitRefConfidence GVCF + GenotypeGVCFs 模式FPGA異構(gòu)加速,提高群體樣本基因型GVCF檢測(cè)效率,一致率高達(dá)99.5%。
支持GATK v3.8和GATK v4.0.6版本的 HaplotypeCaller --emitRefConfidence GVCF + GenotypeGVCFs 模式FPGA異構(gòu)加速,提高群體樣本基因型GVCF檢測(cè)效率,一致率高達(dá)99.5%。
應(yīng)用場(chǎng)景
二代基因組測(cè)序加速
使用基於FPGA平臺(tái)對(duì)GATK Best Practices進(jìn)行加速,WGS(30X)分析從40+H降至6H,WES分析低於1H,同時(shí)精準(zhǔn)性與GATK標(biāo)準(zhǔn)流程完全吻合。
客戶(hù)案例
-
客戶(hù)痛點(diǎn)
從事癌症疾病樣本的WES和panel數(shù)據(jù)的基因變異檢測(cè)。在本地使用GATK/Mutect2流程對(duì)樣本數(shù)據(jù)進(jìn)行體細(xì)胞變異檢測(cè)需要3+天時(shí)間。流程耗時(shí)長(zhǎng),嚴(yán)重製約了業(yè)務(wù)拓展。
-
解決方案
採用華為雲FPGA基因加速方案,加速流程在完全遵循原始GATK標(biāo)準(zhǔn)流程基礎(chǔ)上,幫助客戶(hù)實(shí)現(xiàn)從FASTQ到VCF germline or somatic)全步驟加速。
-
加速效果
客戶(hù)本地一對(duì)39G的WES tumor/ normal樣本用GATK最佳實(shí)踐流程進(jìn)行體細(xì)胞變異檢測(cè)耗時(shí)為79.5小時(shí),使用華為雲FPGA加速流程僅需13小時(shí),一致性在99%以上。
-
客戶(hù)價(jià)值
樣本變異檢測(cè)平均提速6倍以上,大大縮短項(xiàng)目周期,提升了單位時(shí)間項(xiàng)目流量。提升產(chǎn)品競(jìng)爭(zhēng)力的同時(shí)大大降低了成本,滿(mǎn)足了業(yè)務(wù)拓展的需求。
使用指南
— 幫助文檔 —